你在美国的监控名单里吗? -美国TSDB恐怖分子筛查数据库简介
2014年,美国独立新闻网站Intercept发布了一条来自于美国国家安全部门的机密信息,该信息披露美国联邦调查局(FBI)下属的恐怖分子筛选中心(TSC)负责管理一个大型恐怖分子筛选数据库(TSDB-Terrorist Screening Data Base),恐怖分子名单数据库在不断扩大。截至2016年6月,该名单估计有超过2484442条记录,其中包括1877133个个人身份。每天大约有1600个提名,名单中大约每二十人只有一人是美国公民或合法永久居民。
Intercept发布的机密文件
TSDB的管理和使用
TSDB有关数据
恐怖分子筛查数据库是一个机密的大型数据库,里面包含被确定的恐怖分子、涉嫌与恐怖主义相关的人、或在某种情况下与恐怖分子或恐怖分子嫌犯有关系的人或其同伙。数据库通常会给限制乘坐商业航班入境美国或在美国国内乘坐民航人员名单提供人名,后者范围要小一些。
美国联邦调查局建立恐怖分子筛查中心,标准化关于嫌疑恐怖分子的信息,在各级政府机构中组织实施,进而罗列出名单,并加强政府机构间相关沟通。 恐怖分子筛查中心的数据库中有关恐怖分子身份的非机密敏感资料,例如其姓名和出生日期,这些均可与其他筛查机构分享。政府会聘请专家整理收集到的恐怖分子信息,将其核实、考证、比对、拼接或者删除新的条目之后加入数据库。数据库中的监视名单必须每天更新,修改和删除现有的记录。每晚十点,恐怖分子筛查中心的数据库将当天收获的非保密信息传送到FBI下属数据库“恐怖分子甄别中心”,其中通常包含人名、出生日期、国籍和护照号码等等,FBI每天都会向其中加入上千新的名字,大都是没有国际背景的美国国籍嫌疑人。
恐怖分子数据样图
数据库的建立必然需要相应的数据采集手段,美国是如何做的呢?
利用“元数据”采集恐怖分子数据
对于恐怖分子数据的采集,不管是美国国家安全局的批评者还是维护者都在热烈讨论“元数据”——即美国国家安全局通过“棱镜”计划等秘密监控手段为美国政府搜集来的公众的电话、网络等个人信息。美国国家安全局收集了电信巨头威瑞森以及其他美国电话运营商旗下所有用户的一切通话记录:包括通话日期、时长以及通话的参与者等等。
我们从一个经典的场景分析如何利用“元数据”采集恐怖分子数据。美国情报官员截获“基地”组织的一个关键暗语,并且获得了也门“基地”组织筹款人的电话号码。假设你是美国国家安全局的分析师,被授 44 33605 44 14942 0 0 2912 0 0:00:11 0:00:05 0:00:06 3034通过“元数据”找出这个“基地”筹款人的社会关系网络,你的起点就是这个电话号码。
A.第一步很简单:将这个筹款人的电话号码输入“元数据”分析软件,你会得到79个在过去30天与“基地”筹款人有过联系的电话号码。
B.通过“元数据”可以“称量”出每个与这个号码联系的电话号码的分量,即通过通话时间长短、联系人所在位置以及通话时间段来判断联系人与“基地”筹款人的关系。美国国家安全局的培训手册中详细地列出了不同数据代表的这个联系人的不同的威胁级别。
C.画出数据曲线图(如图3),每个点代表一个电话号码,点越大代表威胁“分数”越高。
D.回到“元数据”中,查出这79名与“基地”筹款人通过电话的人中有没有互相通过电话的。于是,通过一种常用的数学计算方法,每个电话号码都可以被算出在这个网络中的重要程度,高得分号码的主人显然在这个社会网络中是更为重要的角色。
做完这些步骤之后,如果所获不多,下面你就该检查所有这79个号码的通话记录。这就是所谓的“大数据”之路,在这不详细介绍。
美国国家安全局分析师的分析图
这种采集方式一旦明显越过了“国外情报监视法”所允许的界限,如果还想继续使用此技术,就必须解决一些棘手的问题:1. 在调查成为棘手的“侵犯隐私”之前,情报分析师可以在多大程度上接触美国公民的个人数据? 2. 数据越完整,元数据分析就越精确,那么应该用“最小化”程序将美国公民的数据过滤掉吗?等等。这些问题不能通过投票解决,也难以由专家提出见解解决,即使通过合理和准确的方式进行讨论都不是一件容易解决的事。
生物特征采集恐怖分子数据
根据泄露的文件显示,恐怖分子身份指挥部(DTI)启动了一项强制程序来收集所有在TIDE名单上的美国人的生物计量数据以及其他信息,包括面部图像、指纹和虹膜扫描。文件称,“这一项目包括国务院和情报机构的数据库里的记录研究及批量数据要求的信息”。在此过程中,DTI提取了所有拥有伊利诺伊州、印第安纳州、威斯康辛州驾照的人的TIDE记录。这些就是通过生物特征采集恐怖分子数据。
理想的生物特征提取数据
在波士顿和芝加哥, DTI大力推动了对一百多万人的生物特征信息的提取,其中包括成百上千并未在监视清单里的人。2013年,DTI的生物特征分析部门(BAB)成立,主要从全美境内的驾照记录中获取生物特征信息,协助DTI获取驾照上的面部图像。该文件指出,BAB 将它“独特的面部识别技术支持”提供给“广泛的客户群”,其分析师已经为其他政府机构提供了290份报告。
机密文件显示:2013年,主要的恐怖主义数据库里包括14.4万人的86万份生物特征信息文件。数据库包含超过50万的面部图像,将近25万的指纹和7万虹膜扫描信息。尽管政府还不能确定有些人的身份,但已拥有他们的生物特征信息。TIDE拥有1800个“BUP”(未知人物的生物计量信息)。仅仅一年以后,政府已扩展到对“非传统”的生物特征信息的收集并急剧增加,包括笔迹样本、签名 、伤痕和纹身和DNA链等方面。
云计算和大数据技术采集恐怖分子数据
在计算机时代,恐怖分子在网络中很活跃,通过计算机网络传播恐怖主义理念和进行恐怖主义活动。然而,道高一尺魔高一丈,美国中情局已经开始利用云计算和大数据技术,通过数据分析找出恐怖分子。所以云计算和大数据对中情局来说,有着至关重要的作用。
美国中央情报局CTO Gus Hunt透露,中情局已经有自己的“私有云”,并且用了一系列云计算软件进行庞大的数据处理。云计算帮助分析情报并找到可疑规律,而大数据可以帮助探员们迅速查找到情报。虽然很多人都关心云计算的安全问题,但Gus表示,如果操作得当,云计算会比普通的计算更加安全。Gus认为云计算有这个潜能是因为它需要一个动态的虚拟环境去支持,中情局会根据这个特性不断更新虚拟机器,让所有的电脑及时更新,敌方就不会知道到底哪一台电脑里面是他们想要的数据。目前,中情局的系统还未应用在社交网络中,但是在局内已经有了可以分享的工具。2013年奥巴马政府对中情局的预算做了削减,但是由于云计算模式更加节约成本,中情局也加快了云计算部署的步伐。
美国中央情报局原CTO Gus Hunt
总结
恐怖分子筛查数据库的建立可以说是一把双刃剑。一方面,它有助于加强对嫌疑恐怖分子的监督,减少人为灾难的发生;但是,另一方面,对于众多没有从事恐怖行为的公民来说,被列入恐怖分子筛查名单,无疑是侵犯了个人隐私。恐怖分子筛查数据库对公民个人隐私权的侵犯已经造成公愤,引起美国公民自由联盟的批评。
参考文献:
1. Terrorist Screening Database, Wikipedia, https://en.wikipedia.org/wiki/Terrorist_Screening_Database
2. The Intercept, Directorate of Terrorist Identities (DTI) Strategic Accomplishments 2013, Aug 2014, https://theintercept.com/document/2014/08/05/directorate-terrorist-identities-dti-strategic-accomplishments-2013/
3. The Intercept, Watch Commander Barack Obama's Secret Terrorist Tracking System, by the Numbers, August, 2014, https://theintercept.com/2014/07/23/blacklisted/
4. Greg Satell, How The NSA Uses Social Network Analysis To Map Terrorist Networks, DigitalTonto, 2013 June 12, http://www.digitaltonto.com/2013/how-the-nsa-uses-social-network-analysis-to-map-terrorist-networks/
5. Gus Hunt, CTO of the CIA presentation at the 2012 Government Big Data Forum. Perspectives on Big Data Mission and Needs Gus Hunt CIA CTO, https://pt.slideshare.net/brianahier/perspectives-on-big-data-mission-and-needs-gus-hunt-cia-cto
6. Our Partners, NSA Domestic Surveillance Directorate, https://nsa.gov1.info/partners/index.html
责任编辑:蔡北平
中国保密协会科学技术分会
请长按二维码识别,关注中国保密协会科学技术分会微信号。
往期精彩文章TOP5回顾